import pandas as pd
import os
import random

os.makedirs('dataset', exist_ok=True)

positive_texts = [
    "这部电影真的非常精彩，情节紧凑，演技到位。",
    "演员演技爆棚，值得一看！",
    "音乐和画面都很美，令人感动。",
    "剧情精彩，紧凑有趣！",
    "演员表现非常到位。",
    "影片节奏感很强，值得推荐。",
    "配乐很棒，情感渲染到位。",
    "整体水准很高，是佳作。",
    "视觉效果震撼，体验极佳。",
    "感人至深的一部电影。",
]

negative_texts = [
    "剧情很无聊，看得我直打瞌睡。",
    "故事老套，完全没有新意。",
    "浪费时间，烂片一部。",
    "表演僵硬，令人出戏。",
    "特效廉价，剧情松散。",
    "节奏拖沓，看得头疼。",
    "对白尴尬，情节漏洞百出。",
    "故事线混乱，毫无逻辑。",
    "叙事手法幼稚，观感差。",
    "整体体验糟糕，不推荐。",
]

# 生成测试数据（20条）
test_data = []
for _ in range(10):
    test_data.append((random.choice(positive_texts), 1))
    test_data.append((random.choice(negative_texts), 0))
random.shuffle(test_data)

# 保存为 test.csv
test_df = pd.DataFrame(test_data, columns=["text", "label"])
test_df.to_csv('dataset/test.csv', index=False, encoding='utf-8')

print("✅ 已生成 test.csv 文件！")
